#aprendizaje online

Aprendizaje offline-online en bandidos lineales

Descubre cómo nuestro algoritmo combina datos offline y exploración online en bandidos lineales para minimizar el arrepentimiento. Resultados empíricos demuestran su eficacia.

2026-06-04 · 2 min

Algoritmos basados en medias: cota inferior y regret

Descubre la primera cota inferior para algoritmos basados en medias en bandidos con horizonte desconocido. Nuevos algoritmos competitivos y su relación con no-regret.

2026-06-04 · 2 min

Aprendizaje online con regret de intervalo por variación de gradiente

Descubre: Primer algoritmo de aprendizaje online con regret de intervalo adaptativo a la variación del gradiente. Garantías óptimas y ajuste automático.

2026-06-03 · 1 min

Aprendizaje online en MDPs con transiciones y pérdidas adversariales parciales

Descubre nuevos algoritmos para MDPs con transiciones adversariales que logran regret sublineal. Basados en medidas de ocupación condicionadas.

2026-06-02 · 2 min

Control adversario del Valor en Riesgo Condicional mediante inferencia conforme

Controla el CVaR en entornos adversarios sin estacionariedad. Método basado en inferencia conforme garantiza seguridad. Ideal para portafolios y LLMs.

2026-06-02 · 1 min

Aprendizaje para pujar en mercados FCR: lo mejor de dos mundos

Descubre cómo un algoritmo de aprendizaje dual logra pujas óptimas en mercados FCR europeos, combinando eficiencia estocástica y robustez adversarial. ¡Mejora tu estrategia!

2026-06-01 · 2 min

Aprendizaje Online Transductivo Multiclase Universal

Descubra cómo la nueva estructura 'Árbol LCLL' define la aprendibilidad en clasificación online transductiva con etiquetas ilimitadas, y las dos únicas tasas óptimas posibles.

2026-06-01 · 2 min